EvoClass
IA012
Aprofundamento em Modelos de Linguagem de Grande Porte
Agentes Autônomos, RLHF e Alinhamento de Segurança
Objetivos de Aprendizagem
- Analise os componentes arquiteturais de agentes com interface gráfica (GUI), incluindo módulos de planejamento, tomada de decisão e reflexão em sistemas multiagentes.
- Explique a mecânica do Aprendizado por Reforço (RL) e RLHF, especificamente o papel dos modelos de recompensa e do PPO no alinhamento do comportamento do agente com valores humanos.
- Avalie os riscos de segurança e problemas de confiabilidade em agentes autônomos, incluindo erros fora da distribuição (OOD), ataques de fuga (jailbreak) e distrações ambientais.